A200 产品规格书
Copyright
本文件为知合计算技术(上海)有限公司(以下简称“--公司--”)的财产,未经公司同意或书面同意,不得向任何第三方披露、给予或转让。如违反本条规定,给公司造成损失的,应当承担赔偿责任。
Contacts
知合计算技术(上海)有限公司
地址: 上海市浦东新区申江路 5005 弄星创科技广场 3 号楼 12F
邮箱: business@zhcomputing.com
电话: 0571-87208790
简介
A200 是一款低功耗、高性能、高安全、多模态感知和多媒体 AP 能力的 AI 处理器芯片,可用于刷脸支付终端、AI边缘计算、视频会议一体机、人脸识别考勤门禁、带屏智能音箱等应用场景。基于多核异构架构,集成 RISC-V指令架 构的四核 C910 和单核 C906 处理器。
内嵌多个强大硬件加速引擎,提供性能优化的高端应用。支持 H.265/H.264/VP9 标准视频编码,最高分辨率达 4K@60fps,支持H.265/H.264/VP9/AVS2 等多格式视频解码,最高分辨率达 4K@120fps,支持 JPEG 编解码,最高分辨率达 32Kx32K。
内嵌 3D GPU 完全兼容 OpenGL ES3.0/3.1/3.2,OpenCL 1.1/1.2/2.0 和 Vulkan 1.1/1.2,支持 2D 加速引擎,以及通用 DSP 加速器。
支持双通道外部存储器接口,支持 LPDDR4/LPDDR4X ,提供最大存储带宽达 34GB/s,同时提供满足多变应用的外设接口。
功能特性
高性能处理器核
-
四核 RISC-V 64GCV 指令集架构 C910,最高主频可达 2GHz
-
支持小端模式
-
9~12 级深流水架构
-
3 发射 8 执行的超标量架构,对软件完全透明
-
按序取指,乱序发射,乱序完成和按序退休
-
两级高缓结构,哈佛结构一级高缓和共享的二级高缓
-
一级缓存支持 MESI 的一致性协议,二级缓存支持 MOESI 的一致性协议
-
每核支持 64KB I cache 和 64KB D Cache
-
四核共享 1MB L2 Cache
-
支持私有中断控制器 CLINT 和公有中断控制器 PLIC
-
两级 TLB 内存管理单元,实现虚实地址转换与内存管理
-
指令高缓路预测的低功耗访问技术
-
短循环缓存的低功耗执行技术
-
支持 segment load、store 指令
-
支持计时器功能
-
支持 TEE 和 REE,TEE/REE 支持核数启动时可配置
-
支持 Linux 和 Android
-
支持自定义且接口兼容 RISC-V 的多核调试框架
-
独立电源域,支持 DVFS
AI 计算引擎
-
支持 4TOPS@INT8 通用 NNA 算力,主频 1GHz
-
支持 INT8, INT16
-
支持 TensorFlow,ONNX,Caffe
-
支持 CNN,DNN 等
-
支持卷积、激活、单元操作(加法、乘法、最大值、最小值)、池化(最小值、最大值、平均值)、归一化、反卷积
-
无损权重数据压缩
-
灵活比特深度支持:灵活的输入输出和中间数据位深度,8~16 位
-
带宽缩减:
-
支持权重压缩,最小化 DDR 带宽需求,降低功耗
-
支持片上缓存,存储网络中间层数据,减小网络运行对 DDR 带宽需求
-
存储接口
-
片内存储
-
片内 SRAM:128KB
-
片内共享 SRAM:1.5 MB
-
-
片外存储
-
LPDDR4/LPDDR4X
-
支持 32/64 位 LPDDR4/LPDDR4X,最高速率 4266Mbps
-
兼容 JEDEC 标准LPDDR4-2133/LPDDR4-3200/LPDDR4-3733/LPDDR4-4266/LPDDR4X-2133/LPDDR4X-3200/LPDDR4X-3733/LPDDR4X-4266 SDRAM
-
支持 2 个通道,每个通道 32 位数据位宽
-
最大 16GB 地址空间
-
32 位和 64 位软件可配置
-
支持不同 LPDDR4/4X 颗粒时序参数可配置
-
命令重排序和调度,最大化带宽利用率
-
ODT 电阻可编程,动态 PVT 补偿
-
-
SPI NOR/NAND Flash 接口
-
支持 2 路 QSPI,1 路 SPI
-
QSPI0 最高 100MHz,QSPI1 和 SPI 最高 66MHz
-
支持 1 位/2 位/4 位数据线模式传输
-
2 个 QSPI 接口,可配置为 Mode0/Mode1/Mode2/Mode3
-
-
eMMC5.1 接口,最高速率支持 HS400
-
兼容 JEDEC 标准 eMMC5.1 和 eMMC5.0
-
支持 HS400,HS200,DDR52 模式
-
支持 eMMC 启动
-
在 8 位数据线模式下:
-
HS400 模式(200MHz DDR),理论最高数据率可达 400MB/s
-
HS200 模式(200MHz SDR),最高数据率 200MB/s
-
DDR52 模式(52MHz DDR),最高数据率 104MB/s
-
-
支持 1 位/4 位/8 位数据线模式传输
-
-
SD3.0 接口
-
兼容 SD3.0
-
1 个 SD 接口,可配置为 SD/MMC/SDIO
-
最高数据传输带宽 100MB/s
-
支持1 位/4 位数据线传输模式
-
-
图像处理单元
-
支持APIs:
-
支持Vulkan1.1/1.2
-
支持OpenCL1.1/1.2/2.0
-
支持OpenGLES3.0/3.1/3.2
-
-
基于分片的 3D 图形渲染,支持多个分片同时处理
-
可编程的高质量抗混叠
-
支持和 NNA 的 AI 协同
-
先进的 DMA 操作,降低主 CPU 负载
-
压缩纹理编码
-
无损数据压缩
-
固件执行专用处理器
-
性能
-
支持3D 图形加速引擎,3200Mpixel/sec@800MHz
-
F32 操作,每个时钟周期 64 次
-
F16 操作,每个时钟周期 128 次
-
整数操作,每个时钟周期 32 次
-
几何操作,每 4 个时钟周期 1 次三角形操作
-
二维图像加速器
-
输入与输出
-
支持 8/10 位 YUV 4:2:2/YUV 4:2:0 输入输出格式
-
支持 RGB444/RGB565/RGB888/RGB101010 输入输出格式
-
支持 ARGB4444/ARGB1555/ARGB8888/ARGB2101010 输入输出格式
-
输入输出数据存储格式与 ISP/VENC/VDEC/NPU/DPU/GPU 等适配
-
-
2D操作
-
bitBlit
-
stretchBlit
-
rect fill & clear
-
filterblit
-
Alpha Blending
-
90/180/270 rotation
-
scale/crop
-
line
-
RGB2YUV
-
YUV2RGB
-
-
Multi-src blit
-
支持不同尺寸 rect 多源混叠
-
支持最多 8 个源
-
支持每个源设置单独的旋转参数
-
支持每个源设置单独的缩放参数
-
数字信号处理器
-
支持 2 路独立 DSP 核,主频 1GHz
-
支持 256 个 8x8 MAC
-
支持 16 个单精度 VFPU
-
支持图像直方图统计
-
32KB 指令 Cache
-
2 个 128KB 数据 RAM
-
操作类型
-
加载和存储
-
乘法运算
-
除法运算
-
矢量压缩和扩展
-
算术运算
-
位逻辑运算
-
位操作
-
比较运算
-
移位作业
-
旋转操作
-
递减操作
-
打包操作
-
选择和双重选择操作
-
随机混合操作
-
移动操作
-